Hugging Face

# Hugging Face

EasyControl Ghibli

Easycontrol Ghibli

EasyControl Ghibli 是一個新發布的模型，基於 Hugging Face 平臺，旨在簡化控制和管理各種人工智能任務。該模型結合了先進的技術和用戶友好的界面，允許用戶以更直觀的方式與 AI 交互。它的主要優勢在於易用性和強大的功能，使其適合不同背景的用戶，不論是初學者還是專業人士都能輕鬆上手。

開發與工具

Llama-3.1-70B-Instruct-AWQ-INT4

Llama 3.1 70B Instruct AWQ INT4

Llama-3.1-70B-Instruct-AWQ-INT4是一個由Hugging Face託管的大型語言模型，專注於文本生成任務。該模型擁有70B個參數，能夠理解和生成自然語言文本，適用於多種文本相關的應用場景，如內容創作、自動回覆等。它基於深度學習技術，通過大量的數據訓練，能夠捕捉語言的複雜性和多樣性。模型的主要優點包括高參數量帶來的強大表達能力，以及針對特定任務的優化，使其在文本生成領域具有較高的效率和準確性。

Llama-Lynx-70b-4bit-Quantized

Llama Lynx 70b 4bit Quantized

Llama-Lynx-70b-4bit-Quantized是由PatronusAI開發的一個大型文本生成模型，具有70億參數，並且經過4位量化處理，以優化模型大小和推理速度。該模型基於Hugging Face的Transformers庫構建，支持多種語言，特別是在對話生成和文本生成領域表現出色。它的重要性在於能夠在保持較高性能的同時減少模型的存儲和計算需求，使得在資源受限的環境中也能部署強大的AI模型。

Llama-lynx-70b-4bitAWQ

Llama Lynx 70b 4bitAWQ

Llama-lynx-70b-4bitAWQ是一個由Hugging Face託管的70億參數的文本生成模型，使用了4-bit精度和AWQ技術。該模型在自然語言處理領域具有重要性，特別是在需要處理大量數據和複雜任務時。它的優勢在於能夠生成高質量的文本，同時保持較低的計算成本。產品背景信息顯示，該模型與'transformers'和'safetensors'庫兼容，適用於文本生成任務。

glider-gguf

PatronusAI/glider-gguf是一個基於Hugging Face平臺的高性能量化語言模型，採用GGUF格式，支持多種量化版本，如BF16、Q8_0、Q5_K_M、Q4_K_M等。該模型基於phi3架構，擁有3.82B參數，主要優點包括高效的計算性能和較小的模型體積，適用於需要快速推理和低資源消耗的場景。產品背景信息顯示，該模型由PatronusAI提供，適合需要進行自然語言處理和文本生成的開發者和企業使用。

FastHunyuan

FastHunyuan是由Hao AI Lab開發的加速版HunyuanVideo模型，能夠在6次擴散步驟中生成高質量視頻，相比原始HunyuanVideo模型的50步擴散，速度提升約8倍。該模型在MixKit數據集上進行一致性蒸餾訓練，具有高效率和高質量的特點，適用於需要快速生成視頻的場景。

Recursal AI

Recursal AI致力於使人工智能技術對所有人開放，無論語言或國家。他們的產品包括featherless.ai、RWKV和recursal cloud。featherless.ai提供即時且無需服務器的Hugging Face模型推理服務；RWKV是一個下一代基礎模型，支持100多種語言，推理成本降低100倍；recursal cloud則讓用戶能夠輕鬆地微調和部署RWKV模型。這些產品和技術的主要優點在於它們能夠降低AI技術的門檻，提高效率，並支持多語言，這對於全球化背景下的企業和開發者來說至關重要。

InternVL2_5-26B

Internvl2 5 26B

InternVL2_5-26B是一個先進的多模態大型語言模型（MLLM），在InternVL 2.0的基礎上，通過引入顯著的訓練和測試策略增強以及數據質量提升，進一步發展而來。該模型保持了其前身的“ViT-MLP-LLM”核心模型架構，並集成了新增量預訓練的InternViT與各種預訓練的大型語言模型（LLMs），例如InternLM 2.5和Qwen 2.5，使用隨機初始化的MLP投影器。InternVL 2.5系列模型在多模態任務中展現出卓越的性能，尤其在視覺感知和多模態能力方面。

FineWeb2

FineWeb2是由Hugging Face提供的一個大規模多語言預訓練數據集，覆蓋超過1000種語言。該數據集經過精心設計，用於支持自然語言處理(NLP)模型的預訓練和微調，特別是在多種語言上。它以其高質量、大規模和多樣性而聞名，能夠幫助模型學習跨語言的通用特徵，提升在特定語言任務上的表現。FineWeb2在多個語言的預訓練數據集中表現出色，甚至在某些情況下，比一些專門為單一語言設計的數據庫表現更好。

PocketPal AI

PocketPal AI是一款可以在iOS設備上運行的AI聊天應用，它允許用戶直接在設備上與先進的AI模型進行互動，而無需互聯網連接，確保了對話的私密性和安全性。該應用代表了人工智能技術在移動設備上的應用，主要優點包括無需聯網的離線聊天、數據本地處理以保護隱私、以及與Hugging Face平臺的集成，方便用戶搜索、下載和使用GGUF格式的模型。PocketPal AI是LLM Ventures公司的產品，免費提供給用戶，定位於需要私密AI對話和數據處理的用戶群體。

聊天機器人

OLMo-2-1124-7B-Instruct

Olmo 2 1124 7B Instruct

OLMo-2-1124-7B-Instruct是由Allen人工智能研究所開發的一個大型語言模型，專注於對話生成任務。該模型在多種任務上進行了優化，包括數學問題解答、GSM8K、IFEval等，並在Tülu 3數據集上進行了監督微調。它是基於Transformers庫構建的，可以用於研究和教育目的。該模型的主要優點包括高性能、多任務適應性和開源性，使其成為自然語言處理領域的一個重要工具。

聊天機器人

OLMo 2 7B

OLMo 2 7B是由Allen Institute for AI (Ai2)開發的一款7B參數的大型語言模型，它在多個自然語言處理任務上展現出色的表現。該模型通過在大規模數據集上的訓練，能夠理解和生成自然語言，支持多種語言模型相關的科研和應用。OLMo 2 7B的主要優點包括其大規模的參數量，使得模型能夠捕捉到更加細微的語言特徵，以及其開源的特性，促進了學術界和工業界的進一步研究和應用。

Skywork-o1-Open-PRM-Qwen-2.5-1.5B

Skywork O1 Open PRM Qwen 2.5 1.5B

Skywork-o1-Open-PRM-Qwen-2.5-1.5B是Skywork團隊開發的一系列模型，這些模型結合了o1風格的慢思考和推理能力。該模型專門設計用於通過增量過程獎勵增強推理能力，適合解決小規模的複雜問題。與簡單的OpenAI o1模型復現不同，Skywork o1 Open系列模型不僅在輸出中展現出固有的思考、規劃和反思能力，而且在標準基準測試中的推理技能有顯著提升。這一系列代表了AI能力的一次戰略性進步，將原本較弱的基礎模型推向了推理任務的最新技術（SOTA）。

FLUX.1-dev-IP-Adapter

FLUX.1 Dev IP Adapter

FLUX.1-dev-IP-Adapter是一個基於FLUX.1-dev模型的IP-Adapter，由InstantX Team研發。該模型能夠將圖像工作處理得像文本一樣靈活，使得圖像生成和編輯更加高效和直觀。它支持圖像參考，但不適用於細粒度的風格轉換或角色一致性。模型在10M開源數據集上訓練，使用128的批量大小和80K的訓練步驟。該模型在圖像生成領域具有創新性，能夠提供多樣化的圖像生成解決方案，但可能存在風格或概念覆蓋不足的問題。

文本到圖像

SD3.5-Large-IP-Adapter

SD3.5 Large IP Adapter

SD3.5-Large-IP-Adapter是一個基於Stable Diffusion 3.5 Large模型的IP適配器，由InstantX Team研發。該模型能夠將圖像處理工作類比於文本處理，具有強大的圖像生成能力，並且可以通過適配器技術進一步提升圖像生成的質量和效果。該技術的重要性在於其能夠推動圖像生成技術的發展，特別是在創意工作和藝術創作領域。產品背景信息顯示，該模型是由Hugging Face和fal.ai贊助的項目，並且遵循stabilityai-ai-community的許可協議。

Qwen2.5 Coder Artifacts

Qwen2.5 Coder Artifacts

Qwen2.5 Coder Artifacts是一個託管在Hugging Face平臺上的編程工具集合，代表了人工智能在編程領域的應用。這個產品集合利用最新的機器學習技術，幫助開發者提高編碼效率，優化代碼質量。產品背景信息顯示，它是由Qwen創建並維護的，旨在為開發者提供一個強大的編程輔助工具。產品是免費的，定位於提高開發者的生產力。

MobileLLM-350M

MobileLLM-350M是由Meta開發的自迴歸語言模型，採用優化的Transformer架構，專為設備端應用設計，以滿足資源受限的環境。該模型整合了SwiGLU激活函數、深層薄架構、嵌入共享和分組查詢注意力等關鍵技術，實現了在零樣本常識推理任務上的顯著準確率提升。MobileLLM-350M在保持較小模型尺寸的同時，提供了與更大模型相媲美的性能，是設備端自然語言處理應用的理想選擇。

Aya Expanse

Aya Expanse是一個由CohereForAI開發的Hugging Face Space，它可能涉及到機器學習模型的開發和應用。Hugging Face是一個專注於自然語言處理的人工智能平臺，提供各種模型和工具，以幫助開發者構建、訓練和部署NLP應用。Aya Expanse作為該平臺上的一個Space，可能具有特定的功能或技術，用於支持開發者在NLP領域的工作。

開發與工具

MaskGCT TTS Demo

Maskgct TTS Demo

MaskGCT TTS Demo 是一個基於MaskGCT模型的文本到語音（TTS）演示，由Hugging Face平臺上的amphion提供。該模型利用深度學習技術，將文本轉換為自然流暢的語音，適用於多種語言和場景。MaskGCT模型因其高效的語音合成能力和對多種語言的支持而受到關注。它不僅可以提高語音識別和合成的準確性，還能在不同的應用場景中提供個性化的語音服務。目前，該產品在Hugging Face平臺上提供免費試用，具體價格和定位信息需進一步瞭解。

文本轉聲音

Reverb

Reverb 是一個開源的語音識別和說話人分割模型推理代碼，使用 WeNet 框架進行語音識別 (ASR) 和 Pyannote 框架進行說話人分割。它提供了詳細的模型描述，並允許用戶從 Hugging Face 下載模型。Reverb 旨在為開發者和研究人員提供高質量的語音識別和說話人分割工具，以支持各種語音處理任務。

gradio-bot

gradio-bot是一個可以將Hugging Face Space或Gradio應用轉化為Discord機器人的工具。它允許開發者通過簡單的命令行操作，將現有的機器學習模型或應用快速部署到Discord平臺上，實現自動化交互。這不僅提高了應用的可達性，還為開發者提供了一個與用戶直接交互的新渠道。

AI聊天機器人

Flux.1-dev Controlnet Upscaler

Flux.1 Dev Controlnet Upscaler

Flux.1-dev Controlnet Upscaler 是一個基於Hugging Face平臺的圖像放大模型，它使用先進的深度學習技術來提高圖像的分辨率，同時保持圖像質量。該模型特別適合需要對圖像進行無損放大的場景，如圖像編輯、遊戲開發、虛擬現實等。

Falcon Mamba

Falcon Mamba是由阿布扎比技術創新研究所（TII）發佈的首個無需注意力機制的7B大規模模型。該模型在處理大型序列時，不受序列長度增加導致的計算和存儲成本增加的限制，同時保持了與現有最先進模型相當的性能。

ComfyUI-KwaiKolorsWrapper

Comfyui KwaiKolorsWrapper

ComfyUI-KwaiKolorsWrapper 是一個為 Kwai-Kolors 文本到圖像模型設計的 Diffusers 包裝器。它使用戶能夠通過 Diffusers 庫方便地運行 Kwai-Kolors 的文本到圖像生成流程。該插件支持從 Hugging Face 直接下載模型，並提供了量化模型以減少 VRAM 使用，適用於需要高效率圖像生成的開發者和設計師。

Featherless

Featherless是一個AI模型提供商，專注於為訂閱者提供持續擴展的Hugging Face模型庫。它支持LLaMA-3等模型架構，提供個性化和隱私保護的服務，不記錄用戶聊天或提示。Featherless提供了兩種定價計劃，基礎版每月10美元，高級版每月25美元，分別提供最大15B和72B模型的訪問權限。

Florence-2-base-ft

Florence 2 Base Ft

Florence-2是由微軟開發的高級視覺基礎模型，採用基於提示的方法處理廣泛的視覺和視覺-語言任務。該模型能夠解釋簡單的文本提示，執行諸如圖像描述、目標檢測和分割等任務。它利用FLD-5B數據集，包含54億個註釋，覆蓋1.26億張圖像，精通多任務學習。其序列到序列的架構使其在零樣本和微調設置中均表現出色，證明是一個有競爭力的視覺基礎模型。

ComfyUI-Hallo

ComfyUI-Hallo是一個為Hallo模型定製的ComfyUI插件，它允許用戶在命令行中使用ffmpeg，並從Hugging Face下載模型權重，或者手動下載並放置在指定目錄。它為開發者提供了一個易於使用的界面來集成Hallo模型，從而增強了開發效率和用戶體驗。

Skywork-MoE-Base

Skywork MoE Base

Skywork-MoE-Base是一個具有1460億參數的高性能混合專家(MoE)模型，由16個專家組成，並激活了220億參數。該模型從Skywork-13B模型的密集型檢查點初始化而來，並引入了兩種創新技術：門控邏輯歸一化增強專家多樣化，以及自適應輔助損失係數，允許針對層特定調整輔助損失係數。Skywork-MoE在各種流行基準測試中表現出與參數更多或激活參數更多的模型相當的或更優越的性能。

Chat UI

chat-ui是一個開源的聊天界面，使用開源模型如OpenAssistant或Llama。它是一個SvelteKit應用程序，為hf.co/chat上的HuggingChat應用提供支持。該產品允許用戶通過自定義配置來運行和部署自己的Chat UI實例，支持多種語言模型和功能，如Web搜索、自定義模型等。

AI聊天機器人

Parler-TTS

Parler-TTS 是一個由 Hugging Face 開發的輕量級文本轉語音（TTS）模型，能夠以給定說話者的風格（性別、音調、說話風格等）生成高質量、自然 sounding 的語音。它是基於 Dan Lyth 和 Simon King 發表的論文《Natural language guidance of high-fidelity text-to-speech with synthetic annotations》的工作復現，兩位作者分別來自 Stability AI 和愛丁堡大學。與其他TTS模型不同，Parler-TTS 完全開源發佈，包括數據集、預處理、訓練代碼和權重。功能包括：生成高質量且自然 sounding 的語音輸出、靈活的使用和部署、提供豐富的註釋語音數據集。定價：免費。

精選AI產品推薦

騰訊混元圖像 2.0

騰訊混元圖像 2.0

騰訊混元圖像 2.0 是騰訊最新發布的 AI 圖像生成模型，顯著提升了生成速度和畫質。通過超高壓縮倍率的編解碼器和全新擴散架構，使得圖像生成速度可達到毫秒級，避免了傳統生成的等待時間。同時，模型通過強化學習算法與人類美學知識的結合，提升了圖像的真實感和細節表現，適合設計師、創作者等專業用戶使用。

Lovart

Lovart 是一款革命性的 AI 設計代理，能夠將創意提示轉化為藝術作品，支持從故事板到品牌視覺的多種設計需求。其重要性在於打破傳統設計流程，節省時間並提升創意靈感。Lovart 當前處於測試階段，用戶可加入等候名單，隨時體驗設計的樂趣。

FastVLM

FastVLM 是一種高效的視覺編碼模型，專為視覺語言模型設計。它通過創新的 FastViTHD 混合視覺編碼器，減少了高分辨率圖像的編碼時間和輸出的 token 數量，使得模型在速度和精度上表現出色。FastVLM 的主要定位是為開發者提供強大的視覺語言處理能力，適用於各種應用場景，尤其在需要快速響應的移動設備上表現優異。

KeySync

KeySync 是一個針對高分辨率視頻的無洩漏唇同步框架。它解決了傳統唇同步技術中的時間一致性問題，同時通過巧妙的遮罩策略處理表情洩漏和麵部遮擋。KeySync 的優越性體現在其在唇重建和跨同步方面的先進成果，適用於自動配音等實際應用場景。

Manus

Manus 是由 Monica.im 研發的全球首款真正自主的 AI 代理產品，能夠直接交付完整的任務成果，而不僅僅是提供建議或答案。它採用 Multiple Agent 架構，運行在獨立虛擬機中，能夠通過編寫和執行代碼、瀏覽網頁、操作應用等方式直接完成任務。Manus 在 GAIA 基準測試中取得了 SOTA 表現，展現了強大的任務執行能力。其目標是成為用戶在數字世界的‘代理人’，幫助用戶高效完成各種複雜任務。

Trae國內版

Trae是一款專為中文開發場景設計的AI原生IDE，將AI技術深度集成於開發環境中。它通過智能代碼補全、上下文理解等功能，顯著提升開發效率和代碼質量。Trae的出現填補了國內AI集成開發工具的空白，滿足了中文開發者對高效開發工具的需求。其定位為高端開發工具，旨在為專業開發者提供強大的技術支持，目前尚未明確公開價格，但預計會採用付費模式以匹配其高端定位。

開發與工具

Pika

Pika是一個視頻製作平臺,用戶可以上傳自己的創意想法,Pika會自動生成相關的視頻。主要功能有:支持多種創意想法轉視頻,視頻效果專業,操作簡單易用。平臺採用免費試用模式,定位面向創意者和視頻愛好者。

LiblibAI

LiblibAI是一箇中國領先的AI創作平臺,提供強大的AI創作能力,幫助創作者實現創意。平臺提供海量免費AI創作模型,用戶可以搜索使用模型進行圖像、文字、音頻等創作。平臺還支持用戶訓練自己的AI模型。平臺定位於廣大創作者用戶,致力於創造條件普惠,服務創意產業,讓每個人都享有創作的樂趣。

AIbase

智啟未來，您的人工智能解決方案智庫

English 简体中文繁體中文にほんご

© 2025AIbase